强化学习 rl

与 gan 一样,属于强人工智能